NVIDIA GeForce 800系列,是輝達研發的圖形處理器產品系列,用於筆記型電腦平台。此代顯示核心將採用新的Maxwell微架構(晶片代號將以『GM』開頭),以蘇格蘭理論物理學詹姆士·克拉克·麥克斯韋的名字命名。2014年初悄然發表的行動型顯示核心GeForce 820M,儘管列入GeForce 800系列,但仍採用GeForce 500系列『Fermi』架構的GF117顯示核心,因此僅僅是舊型號顯示核心更名而已。[1][2]首款基於Maxwell微架構的顯示核心實際為GeForce 700系列上的GeForce GTX 750以及750 Ti。[3][4][5]後來,NVIDIA也陸續發布行動平台的GeForce 800M系列的其他型號,除GeForce 830M、840M、GTX 850M以及GTX 860M的部分批次以外,其餘的均使用舊有顯示核心。NVIDIA宣佈新一代Maxwell核心的首發兩款產品將被命名為NVIDIA GeForce 900系列,分別為GTX 970和GTX 980。[6][7]而預計GeForce 800系列將使用在OEM市場,就像之前的GeForce 100GeForce 300系列。

Quick Facts 發布日期, 代號 ...
NVIDIA GeForce 800系列
發布日期2014年
代號Fermi (28nm)
GF117
Kepler(28nm)
GK104
Maxwell (28nm/20nm)
GM107
GM108
顯示卡
入門GPU行動平台:820M、830M、840M
中階GPU行動平台:GTX 850M、GTX 860M
高端GPU行動平台:GTX 870M、GTX 880M
API支援
Direct3DDirect3D 12
Shader Model 5.0
OpenGLOpenGL 4.4
OpenCLOpenCL 1.2
歷史
前代產品GeForce 700系列
後繼產品GeForce 900系列
Close

概觀

用於GeForce 800系列上的『Maxwell』顯示核心架構,是用於GeForce 600以及700系列『Kepler』顯示核心架構的下一代,將首次在顯示核心上內建ARM架構的CPU核心。[8][9]NVIDIA的CEO黃仁勳稱,這樣做使得GPU更加獨立於主CPU[10]。NVIDIA稱『Maxwell』顯示核心架構對比『Kepler』架構,會有更高的圖形處理效能、更簡化的可程式性以及更好的能效比[11]

2010年9月NVIDIA宣布下一代顯示核心架構『Maxwell』。[12]首款基於『Maxwell』架構的消費級顯示核心的產品將於2014年早期發賣。[13]稍後將有基於『Maxwell』顯示核心的NVIDIA Tesla運算卡以及NVIDIA Quadro專業圖形卡。最後會有供手持式裝置使用的基於該架構的NVIDIA Tegra系統單晶片出現。[11]

架構特性

初期,Maxwell架構顯示核心,仍採用台積電的28nm製程,核心規模也較為有限。首代Maxwell顯示核心有GM107和GM108,均面向消費級市場,相比Kepler而言僅是多了一些Kepler架構所沒有的附加功能特性,效能、功耗及能效比上與Kepler相去不遠。這些新增的特性主要有:

  • NVENC效能的加強。NVENC是NVIDIA開發的視訊解碼器,在初代Maxwell顯示核心上的效能為1.5倍到2倍於Kepler顯示核心,在6到8倍的回放速率使仍能實時解碼。[14]
  • PureVideo效能加強。NVIDIA提升了Maxwell的視訊解碼快取和記憶體存取效率,稱在Pure Video E功能集視訊解碼時,比以往的有8到10倍效能提升。然而,H.265硬體解碼的支援度仍然不完整,需要軟體以及硬體共同執行。[14]
  • 新增一個電源模式『GC5』。當顯示核心進行視訊解碼作業時,會進入一個新的『GC5』電源模式,只保留視訊解碼所需的電路單元的電力供應,節省電力。[14]

顯示記憶體

GM107的L2快取,由GK107的256KB,大幅增加到2MB,大大降低對顯示記憶體的頻寬需求。相應地,NVIDIA僅為GM107的使用128位元的記憶體控制器位寬,而GM107的效能與kepler的192位元記憶體位寬的GK106不相上下,除此以外,減少了記憶體位寬,還會節省電能。[14]

SMM

Kepler時代,CUDA核心/流處理器陣列被NVIDIA稱作SMX,而Maxwell的設計,則改稱SMM。SMM陣列中,各陣列是分離獨立的,因此陣列中的4個排程引擎控制各自所屬的FP32 CUDA核心、載入/儲存單元以及特殊功能單元,不像Kepler那樣一個排程引擎需要共享資源。不過,紋理單元以及FP64 CUDA核心則仍然是共享的。[14]SMM提供比SMX更細粒度的資源分配,當負載並非為共享資源最佳化時節省電力。NVIDIA稱128個CUDA核心的SMM可以達到192個CUDA核心的SMX的90%的效能。[14]

通用運算

相比GK110/GK208支援CUDA 3.5,GM107可以支援CUDA 5.0通用運算庫。在GK110/GK208上現身的動態並行以及HyperQ,基於Maxwell架構的顯示核心會全面支援。Maxwell架構為32位元整數的原子操作提供原生共享記憶體,支援32位元和64位元的數據比較和交換(compare-and-swap,CAS),可實現其它形式的原子操作功能。

API

Maxwell架構全面支援DirectX 12。[15]

繼任架構

接替『Maxwell』顯示核心架構的,是NVIDIA於2013年3月宣布的代號『Volta』的顯示核心架構。[16]2014年,這個構想的架構被定名為『Pascal』[17][18] 『Pascal』將實現片上堆疊式動態隨機存取記憶體(DRAM),或稱『片上顯示記憶體』,統一記憶體架構以及NVLink。[19][17]

產品介紹

桌上型平台

首款基於Maxwell架構的顯示核心是GM107,但它卻被劃入GeForce 700系列,是為GeForce GTX 750和GTX 750 Ti,均使用28奈米製程,[14]它們均於2014年2月18日發布。GeForce GTX 750和GTX 750 Ti的TDP分別僅為55瓦和60瓦,這樣使得它們都能直接從PCIe插槽中獲取足夠的電能而無需輔助供電連接埠。[14]第二款基於Maxwell架構的顯示核心GM204被劃入GeForce 900系列,是為GeForce GTX 970和GTX 980,它們均於2014年9月19日發布。

行動平台

GeForce 800M的首發產品是GeForce 820M[20] - 使用『Fermi』顯示核心架構的GF117顯示核心,僅支援PCI-E 2.0,但支援DirectX 11.2、OpenGL 4.4、OpenCL 1.1、FXAA以及Optimus雙顯示核心切換,搭載DDR3顯示記憶體。其後發布的GeForce 830M、840M使用規格較低,但基於Maxwell架構的GM108顯示核心。GeForce GTX 850M以及GTX 860M後來推出的批次,採用GM107顯示核心。GeForce GTX 860M早期版本、870M以及880M均使用GK104核心,但各型號的核心組態不一。

晶片規格

GeForce 800系列本代僅供筆記型電腦使用,而同架構的桌上型電腦用圖形處理器產品,則為GeForce 900系列以及GeForce GTX 750/750Ti。

  • 1 統一彩現器/流處理器數量 : 紋理對映單元數量 : 彩現輸出單元數量
  • 2 畫素填充率的估算:ROP的數量乘以基準核心時脈速率(時脈單位Hz),單位畫素數每秒(P/s)
  • 3 紋理填充率的估算:TMU的數量乘以基準核心時脈速率(時脈單位Hz),單位紋理數每秒(T/s)
  • 4 全系列可支援Direct3D 12,但功能層級會是更低的Feture Level 11_0
  • 5 單精度浮點數處理效能的估算,由著色器時脈乘以CUDA核心/流處理器數量和每時鐘週期CUDA核心/流處理器指令數;雙精度浮點數處理效能的估算:核心代號「GMxxx」的為單精度浮點數的1/32,核心代號「GKxxx」的為單精度浮點數的1/24
  • 6 時脈資料與實際使用的可能有差別,核心代號「GFxxx」的核心時脈分為兩部分:CUDA核心時脈/著色器時脈
More information 型號, 推出年分 ...
型號 推出年分 晶片代號 製程
(奈米)
電晶體數
(百萬個)
晶粒面積
(平方毫米)
匯流排介面 核心組態
SPs:TMUs:ROPs1
時脈組態 填充率 顯示記憶體組態 API支援(版本)4 運算效能
(GFLOPS)
熱設計功耗
(W)
預設
(MHz)6
加速
(MHz)
記憶體
(MT/s)
像素
(GP/s)2
材質
(GT/s)3
容量
(MiB)
匯流排類型 匯流排寬度
(位元)
頻寬
(GB/s)
DirectX OpenGL OpenCL Vulkan 單精度浮點數5 雙精度浮點數5
GeForce 800M[21][22] 2014年3月17日 GF117 28 585 116 PCIe 2.0 x8 48:8:8
(1 SM)
738/1476 N/A 1800 1.476 5.9 2048 DDR3 64 14.4 11.0 4.5 1.1 未知 141.7 未知 15
GeForce 810M (GF117)[23] 2014年3月24日 GF117 28 585 116 PCIe 2.0 x16 48:8:8
(1 SM)
738/1476 N/A 1800 1.576 5.9 1024
2048
DDR3 64 16 11.0 4.4 1.1 未知 141.7 未知 15
GeForce 810M (GK107)[24] 2015年3月21日 GK107 28 1270 118 PCIe 3.0 x16 384:32:16
(2 SMX)
810 未知 1800 6.48 25.92 1024
2048
DDR3 128 28 11.2 4.5 1.2 未知 622.1 未知 45
GeForce 820M (GF117)[20][25] 2013年11月27日 GF117 28 585 116 PCIe 2.0 x16 96:16:4
(2 SM)
625/1250~775/1550 N/A 1800 2.5~3.1 10~12.4 1024
2048
DDR3 64 14.4 11.0 4.4 1.1 未知 240~297.6 未知 15
GeForce 820M (GK107)[26] 2015年3月21日 GK107 28 1270 118 PCIe 3.0 x16 384:32:16
(2 SMX)
810 未知 1800 6.48 25.92 1024
2048
DDR3 128 28 11.2 4.5 1.2 未知 622.1 未知 45
GeForce 825M[27] 2014年3月12日 GK208 28 未知 87 PCIe 3.0 x16 384:32:16
(2 SMX)
850 未知 1800 6.8 27.20 1024
2048
DDR3 64 14.4 12.0 4.5 1.2 1.0 652.8 未知 33
GeForce 830M[28] 2014年3月12日 GM108 28 未知 未知 PCIe 3.0/2.0 x16 256:16:8
(2 SMM)
1082 1150 1800 8.66 17.31 2048 DDR3 64 14.4 12.0 4.5 1.2 1.0 554 未知 33
GeForce 840M [29] 2014年3月12日 GM108 28 未知 未知 PCIe 3.0/2.0 x16 384:24:8
(3 SMM)
1029 1124 2000 8.2 24.7 1024
2048
DDR3 64 16.02 12.0 4.5 1.2 1.0 790.3 未知 33
GeForce 845M (GM107)[30] 2015年2月7日 GM107 28 1870 148 PCIe 3.0 x16 512:32:16
(4 SMM)
863 未知 2000 13.81 27.62 1024
2048
DDR3 64 16 12.0 4.5 1.2 1.0 883.7 未知 45
GeForce 845M (GM108)[31] 2015年8月26日 GM108 28 未知 未知 PCIe 3.0 x16 384:24:8
(3 SMM)
1071 1176 5000 17.14 34.3 1024
2048
GDDR5 64 40 12.0 4.5 1.2 1.0 822.5 未知 33
GeForce GTX 850M[32] 2014年3月14日 GM107 28 1870 148 PCIe 3.0 x16 640:40:16
(5 SMM)
936 未知 5000 14.4 36.1 2048 GDDR5
DDR3
128 80
32
12.0 4.5 1.2 1.0 1198.1 未知 45
GeForce GTX 860M (GK104)[33][34] 2014年3月10日 GK104 28 3540 294 PCIe 3.0 x16 1152:96:16
(6 SMX)
797 915 5000 19.13 76.5 2048 GDDR5 128 80 12.0 4.5 1.2 1.0 1836.3 未知 75
GeForce GTX 860M (GM107)[33][35] 2015年2月5日 GM107 28 1870 148 PCIe 3.0 x16 640:40:16
(5 SMM)
1020 1085 5000 16.32 41.2 2048 GDDR5 128 80 12.0 4.5 1.2 1.0 1317.1 未知 75
GeForce GTX 870M[36] 2014年3月12日 GK104 28 3540 294 PCIe 3.0 x16 1344:112:32
(7 SMX)
941 967 5000 30.1 105.4 3072 GDDR5 192 120 12.0 4.5 1.2 1.0 2529.4 未知 100
GeForce GTX 880M[37] 2014年3月12日 GK104 28 3540 294 PCIe 3.0 x16 1536:128:32
(8 SMX)
954 993 5000 30.53 122.1 4096
8192
GDDR5 256 160 12.0 4.5 1.2 1.0 2930.7 未知 122
Close

參見

參考資料

外部連結

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.